پاکسازی داده ها (Data cleaning)، شامل شناسایی و رفع خطاهای احتمالی دادهها برای بهبود کیفیت آنهاست. در این فرآیند، شما دادههای «کثیف» را شناسایی، بررسی، تجزیه و تحلیل، اصلاح یا حذف میکنید تا مجموعه دادههای خود را پاکسازی کنید. دادههای کثیف به معنی ناهماهنگیها و خطاها هستند که میتوانند از هر بخش فرآیند تحقیق، مانند طراحی ضعیف، اندازه گیری غلط، ورود دادههای ناقص و… به دست آیند.
تمیز کردن دادهها، ممکن است به صورت تعاملی با ابزارهای داده کاوی یا به صورت پردازش هستهای از طریق اسکریپتها انجام شود. پس از فرآیند پاکسازی، لازم است مجموعه دادهها با سایر مجموعههای مشابه در سیستم سازگار باشد.
اگر به مبحث پاکسازی داده ها علاقه دارید روی لینک زیر کلیک کنید.
همه چیز درباره داده ها، تحلیل داده ها، یادگیری ماشین و......
ما را در سایت همه چیز درباره داده ها، تحلیل داده ها، یادگیری ماشین و... دنبال می کنید
برچسب : نویسنده : Admin93 bigdata بازدید : 94 تاريخ : دوشنبه 24 بهمن 1401 ساعت: 13:48